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Titel 

Viral kodierte CxC determinieren den Gewebetropismus von HCMV. 



Beschreibung 



Die genetischen Determinanten von Leukotropismus und Endothelzelltropismus 
wurden bereits in der Patentanmeldung PCT/EP02/01867 auf die Region UL132-128 
eingeengt. In der gegenwartigen Patentanmeldung wird die Region nocheinmal mit 
weiteren Virusmutanten untersucht (sieheTabelle) und die Region UL131-128 konnte 
als diejenige Region bestatigt werden, welche den Tropismus fur Leukozyten, 
Monozyten, Endothelzellen sowie potentiell auch andere Zellen und Gewebe 
genetisch determiniert. Die Herstellung der Virusmutanten in FIX-BAC E. coli DH10B 
erfolgfe wie in Patentanmeldung PCT/EP02/01867 beschrieben durch homologe 
Rekombinaition eines linearen PCR Fragmentes in E. coli, wobei 
Recombinationsfunktionen des Bacteriophagen X (red a, 3, y) auf einem Plasmid zur 
Verfugung gestel.lt werden. 

Die folgenden Primer wurden verwendet, urn eine Kan R Kassette aus dem Plasmid 
pAYCY 177 (NEB Biolabs) zu amplifizieren. 

FIXAUL127: 

P-127-for: 5'-TTG AGA TTT CTG TCG CCG ACT AAA TTC ATG TCG CGC GAT 
AGT GGT GTT TAT CGC CGA TAG CGA TTT ATT CAA CAA AGC CAC-G3' 



P-127 -rev: 5'- AAT ATJ GAT TTA CGC TAT ATA ACC AAT GAC TAA TAT GGC 
TAA TGG CCA ATA TTG ATG CAA GGC AGT GTT ACA ACC AAT TAA-3' 



FIXAUL148: 

P-148-for: 5'- GAC TAT GTG CAT GTT CGG CTA CTG AGC TAC CGA GGC GAC 
CCC CTG GTC TTC AAG CAC ACT CGA TTT ATT CAA CAA AGC CAC-3' 

P-148-rev: 5'- CAC CAG GTA GGT TAT CAA AAC GCG AGC CCA TAT CGC CGC 

v 

CAT CAT TGT AAT CAG CAA TGT GCC AGT GTT ACA ACC AAT TAA-3' 
. FIXAUL132K: 

P-1 32-forK: 5'- ACG TCC TCG TCA CAC GTC GTT CGC GGA CAT AGC AAG AAA 
TTC ACG TCG CCA CGT CTC GAG ACG ATT TAT TCA ACA AAG CCA-3'. 

P-132-revk: AAG GTT CTT CCA TTT CCG AGG CGG TCA GTT CAT CGT ACA 
CCG AGA CGT AGT ACC TGA TGG GGC CAG TGT TAC AAC CAA TTA ACC-3' 

FIXAUL132-128: 

P-1 32-forK: 5'- ACG TCC TCG TCA CAC GTC GTT CGC GGA CAT AGC AAG AAA . 
/ TTC ACG TCG CCA CGT CTC GAG ACG ATT TAT TCA ACA AAG CCA-3' 

v \ - 

P-128-rev: 5'-TCG CGC GAC ATG AAT TTA GTC GGC GAC AGA AAT CTC GAA 
ACG CGT ATT TCG GAC AAA CAC ACA TGC CAG TGT TAC AAC CAA TTA ACC- 
3' 

FIXAUL131-128: 

P-1 31 -for: 5'-TGT CTT TCG GTT CCA ACT CTT TCC CCG CCC CAT CAC CTC 
GCC TGT ACT ATG TGT CGA TTT ATT CAA CAA AGC CAC G- 3' 
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P-128-rev: 5'-TCG CGC GAG ATG AAT TTA GTC GGC GAC AGA AAT CTC GAA 
ACG CGT ATT TCG GAC AAA CAC ACA TGC CAG TGT TAC AAC CAA TTA Ace- 
s' 

FIXAUL133-148: 

P-133-for: 5'-CGC TGT AGG GAT AAA TAG TGC GAT GGC GTT TGT GGG AGA 
ACG CAG TAG CGA TGG GTT GCG ACG TGC ACC GAT TTA TTC AAC AAA GCC 
ACG-3' 

P-148-rev: 5'- CAC CAG GTA GGT TAT CAA AAC GCG AGC CCA TAT CGC CGC 
CAT CAT TGT AAT CAG CAA TGT GCC AGT GTT ACA ACC AAT TAA-3' 

5' und 3' RACE Analysen hatten wie in der Patentanmeldung PCT/EP02/01 867 
beschrieben zur Identifizierung bisher unbekannter viraler Transkripte gefuhrt, welche 
durch die Region UL131 bis UL128 laufen mit einem ATG Startkodon in UL131 und 
einem Poly A Signal am Ende von UL128. Die jetzige Patentanmeldung umfasst 
eine genauere Charkterisierung und Translation dieser Transkripte. Wie in der 
zusammenfassenden Abbildung 1 gezeigt, ergibt die Translation des RACE Klons 
95-3 (Abb.2) sowie des RACE Klons 95-8 (Abb. 3) eih CxC CC Mdtiv (rot markiert), 
welches charakteristisch ist fur CxC Chemokine. Dem in der Abbildung 1 rot 
gekennzeichneten CLC Motiv geht ein putatives Signalpeptid voraus. Ausserdem 
zeichnen sich beide als HCK-1 und HCK-2 bezeichneten yiralen Chemokine durch 
eine Reihe' von N-linked Gykolysierungsstellen (blau markiert) aus. Insbesondere 
existiert im Chemokin HCK-1 eine Asparagin-linked Gykolysierungsstelle. Das 129 
Aminosauren lange virale Chemokin HCK-1 entsteht dadurch, dass im RACE Klon 
95-3 durch das Speissen von UL131 Exon 1 und Exon 2 ein Stopkodon am Ende 



von Exon 1 enfernt wird. Das virale Chemokin HCK-2 umfasst 79 Aminosauren und 
entseht dadurch, dass im RACE Klon 95-8 UL13.1 ungespleisst vorliegt, wodurch das 
Stopcodon am Ende von UL131 das virale Chemokin truhkiert. Weiterhin wurde ein 
CC-Chemokin Motiv CC CC idetifiziert (Abb. 4) welches fur ein virales CC Chemokin 
kodiert. Dieses Chemokin, welches HCK-3 benannt wurde, umfasst 59 Aminosauren 
und wird von dem RACE Klon 128 kodiert.. 

Es wurde ein weiteres Transkript identifiziert RACE Klon 95-11 (Abb.5), in welchem 
der Stretch von 7 x A (blaue Markierung in Abb.1) in den RACE Klonen 95-3 und 95- 
8 zu einem Stretch von 9 x A geworden ist. Dieser Stretch von 9 x A zerstort das CxC 
-Chemokin Motiv. Ausserdem liegt in diesem RACE Klon 95-1 1 auch ein weiterer 
Spleiss im Gen UL128 vor, der in den beiden anderen RACE Klonen 95-3 und 95-8 
fehlt. Es ist zu vermuten, dass die neu identifizierten viralen Chemokine HCK-1 , 
HCK-2 und HCK-3 das Trafficking von Leukozyten und Monozyten in HCMV 
infizierten Geweben, insbesondere zu Endothelzellen hin dominieren. Es wird 
vermutet, dass die trunkierte, Form des x CxC Chemokins HCK-2 ein Idsliches 
Chemokin darstellen kann und somit geignet ist, Leukozyten zu HCMV infizierten 
Geweben zu dirigieren. Die langere Form des HCK-1 CxC Chemokines weist 
zahlreiche potentielle N-linked Glykosylierungsstellen auf sowie eine Asparagin- 
linked Glykosylierungsstelle. Es ist daher anzunehmen, dass HCK-1 ein 
membrangebundenes . Chemokin darstellt, welches durch das Endoplasmatische 
Retikulum wandert. Dieses membrangebundene Chemokin konnte fur die 
Mikrofusion von HCMV infizierten Endothelzell mit Leukozyten und Monozyten 
verantwortlich sein und somit ein. wesentlicher Pathogenitatsfaktor fur die 
Disseminierung von HCMV im infizierten Organismus darstellen. Es ist ebenfalls 
anzunehmen, dass durch das viral kodierte CC-Chemokin HCK-3 Monozyten, 
Makrophagen sowie Dendriten angelockt werden und infektioses Virus uber 



Mikrofusion (via HCK-1) auf diese Zellpopulation ubertragen wird. Mit Hilfe von 
Virusmutanten (siehe Tabelle) konnte gezeigt werden, dass das . humane 
Cytomegalievirus seinen Tropismus fur Leukozyten, Monozyten und Endothelzellen 
verliert, wenn die genetische Region UL131-128, welche die viralen Chemokine 
HCK1-3 kodiert, entfernt wird. Damit stellt die genetische Region UL131-128 und die 
davon kodierten viralen Chemokine mit vollkommen neuartiger Struktur einen 
Hauptpathogenitatsmechanismus fur die Infektion von HCMV dar. Fur Drugdesign 
1 (small molecules, antisense RNA etc), antivirale Chemotherapie, 
^ . Impfstoffentwicklung sowie. Gentherapie von HCMV und anderen viralen 
Erkrankungen sowie Autoaggressionserkrankungen und Cancertheraphie sihd die 
neu identifizierten viralen Chemokine von entscheidender Wichtigkeit. Da Viren und 
Wirt eine Koevolution zeigen ist anzunehmen, dass die neuartige Struktur dieser in 
der gegenwartigen Patentanmeldung beschriebenen viralen Chemokine auch 
potenzielle Ahnlichkeit mit noch unbekannten Chemokinen im Menschen (sezerniert 
von Immunzellen des Menschen) haben konnte. 

Interessanterweise konnte auch ein Transkript (RACE KLON 95-11) identifiziert 
werden, in dem durch die Elongation eines Stretches von 7 x A zu 9 x A das CxC 
, < Chemokinmotiv zerstort wird. Es konnte sich hierbei urn einen neuen 
transkriptionellen Mechanismus von HCMV und Herpesviren handeln, urn 
^Gewebetropismus transkriptionell zu regulieren. Es ist moglich, dass in z. B. 
Fibroblasten vermehrt nur ein bestimmtes Transkript hergestllt wird (z. B. 95-11), 
wahrend in Endothelzellen vermehrt diejenigen Transkripte hergestellt werdenr 
welche virale Chemokine und Mikrofusionsfaktoren kodieren (95-3 und 95-8), 
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Anlagen: 

Abbildungen 1-5 und eine Tabelle. 

- 

Tabelle: Tropismus fur Leukozyten und Endothelzelien von RVFIX und 
Virusmutanten. 

RVFIX und Mutanten mit einer Deletion in UL127, UL148, UL131-128, UL132 oder 
UL133-148 wurden phanotypisch auf Verlust von Leukotropismus und Endothelzell 
Tropismus getestet. Die genetische Region UL131-128 konnte als die essentiell 
notwendige Region fur beide Phanotypen Leukotropismus und Endothelzell 
Tropismus identifiziert werden. 

Abb. 1 Schematische Darstellung des Speissingmusters der neu identifizierten RACE 
Klone 95-3, 95-8 sowie 128 und Translation der Klone mit Darstellung der jeweils 
davon kodierten CxC oder CC Chemokine (rot) HCK-1 , HCK-2 und HCK-3; dunkel 
blau: 7 x A stretch. 

Abb. 2 Genomischer Vergleich von FIX-BAC genomischer Sequenz mit dem RACE 
Klon 95-3 sowie Translation des von 95-3 kodierten viralen CxC Chemokines HCK-1 . 
Rot: CxC Chemokin Motiv; blau: N-linked Glykosylierungsstellen; dunkel blau: 7 x A 
stretch. 

Abb. 3 Genomischer Vergleich von FIX-BAC genomischer Sequenz mit dem RACE 
Klon 95-8 sowie Translation des von .95-3 kodierten viralen CxC Chemokines HCK-2. 
Rot: CxC Chemokin Motiv; blau: N-linked Glykosylierungsstellen; dunkel blau: 7 x A 
stretch. 
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Abb. 4 Genomischer Vergleich von FIX-BAC genomischer Sequenz mit dem RACE 
Klon 128 sowie Translation des von 95-3 kodierten viralen CC Chemokines HCK-3. 
Rot: CC Chemokin Motiv; hell blau: N-linked Glykosylierungsstellen. 

Abb. 5 Genomischer Vergleich von FIX-BAC genomischer Sequenz mit dem RACE 
Klon 95-11 sowie Translation des von 95-11 kodierten viralen Produktes. Rot: CxC 
Chemokin Motiv; dunkel blau: 9 x A stretch; pink Box: 2 x A. 



Claims 



1. Studium der genetischen Region UL131-128, welche. Leukotropismus, 
Monozytentropismus und _ Endothezelltropismus im humanen Gytomegalievirus 
(HCMV) bestimmt, in FIX-Bac und alien HCMV Labor- und Wildtyp-Stammen sowie 
BAC klonierten HCMV Stammen (TowL-BAC, HB5-BAC, TowS-BAC, TB40E-BAC, 
Phoebe-BAC, Powers-BAC, AD169-BAC). 

2. Studium und Synthese der neu identifizierten viralen Transkripte in der 
genetischen Region UL131-128, welche ein differentiell gespleisstes Muster zeigen 

a 

und fur strukturell vollkommen neuartige virale CxC und CC Chemokine kodieren. 

3. Studium und Synthese der neu identifizierten viralen Chemokine HCK-1, HCK-2 
und HCK-3 sowie potentiell weiterer in der UL132-128 genetischen Region codierten 
viralen Chemokine und Mikrofusionsfaktoren, Herstellung von monoklonalen 
Antikorpern gegen HGK-1 , HCK-2 und HCK-3, Herstellung von Chemotherapeutika 
und small molecules gegen HCK-1 , HCK-2 und HCK-3. 

4. Herstellung und Studium vori Zelllinien, welche HCK-1, HCK-2 und HCK-3 
exprimieren oder sezernieren. 

5. Studium von Gewebetropismus und Pathogenitat von HCMV mittels 
Virusmutanten, welche HCK-1 , HCK-2 und HCK-3 oder die neu identifizierten 
Transkripte (RACE Klone95-3, 95,8, 95-11, 128) oder weitere noch unbekannte 
Transkripte in der Region von UL1 32-1 28 exprimieren. 
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6. Studium der transkriptionellen und posttransriptionellen Reglemechanismen, 
welche die Kodierung von HCK-1, HCK-2 und HCK-3 und potentiell weiterer von 
UL132-128 . codierter Chemokine/Nikrofusionsfaktoren regulieren und 
Gewebetropismus/Pathogenitat von HCMV und anderen Herpesviren .sowie anderen 
DNA und RNA Viren bestimmen. 

7. Expression von HCK-1 , HCK-2 und HCK-3 oder der neu identifizierten Transkripte 
(RACE Klone95-3, 95,8, 95-11, 128) in humanen oder tierischen Zellen/lmmunzellen, 
urn das Trafficking dieser Immunzellen zu beinflussen. 

8. Anwendung der neu identifizierten viral codierten Chemokine/small molecules 
gegen diese Chemokine bzw. deren humanen Kounterparts sowie potentiell weiterer 
von UL1 32-1 28 codierter Proteine fur die Therapie von viralen Erkrankungen, 
Autoimmunerkrankungen, Krebserkrankungen, rheumatischen Erkrankungen, 
Gentherapie, Vektorentwicklung, I mpfstoffentwicklung, Studium des Einflusses auf 
die Migration von Leukozyten, Monozyten, Dendritischen Zellen NK-Tellen, T-Zellen, 
B-Zellen, Studium von Latenz Und Reaktivierung von HCMV, Apoptose Induktion 
oder Verhinderung, Aktivierung oder Resistenz von NK- und CTL-Zell Erkennung 
von viral infizierten Targetellen (DNA und RNA Viren). 

9. Studiurri des CxC und CC Chemokin-Rezeptor vermittelten Eintritts von HCMV 
sowie anderer DNA und RNA Viren in Gewebezielzellen sowie Studium der 
Zelladharenz. 

10. Strukturanalyse von HCK-1, HCK-2 und HCK-3 sowie weiterer von UL132-128 
kodierter Chemokine und Mikrofusionsfaktoren. 

U 



• • <[/:. 

1 1 . Studium der Koinfektion von Zielzellen durch HCMV und andere DNA sowie RNA 
Viren, insbesondere HIV-Virus. 



W 
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Zusammenfassung 



In der Patentanmeldung PCT/EP02/01867 wurde die Klonierung eines leukotropen 
und endothelzelltropen klinischen Isolates des humanen Cytomegalievirus (HCMV) 
als bakteriell artifizielles Chromosom (BAC) in E. coli beschrieben. Das entprechende 
BAG wurde FIX-BAC benannt. Es wurden weiterhin durch Herstellung und 
phanotypische Testung von Virusmutanten die genetischen Determinanten von 
Ehdothelzell Tropismus und Leukozyten Tropismus auf die genetische Region 
UL132-UL128 eingeengt. 5' und 3' RACE Analysen haben neue Transkripte , 
errtschlusselt, welche gespleisst sind und durch die Region UL131-128 laufen. Die 
gegenwartige Patentanmeldung hat den Schwerpunkt auf einer genaueren Analyse 
der bereits in der PCT/EP02/01867 beschriebenen Transkripte. Die Translation der 
Transkripte ergibt neue viral kodierte CxC und CC Chemokine, die eine wesentliche 
Rolle in der Pathogenese sowie im Gewebetropismus von HCMV spielen. 



Vergleich RACE Klone 95-3 - FIX gehomische Sequenz 

Obere Zeile: RACE Klon 95-3 

Untere Zeile: FIX genomische Sequenz 

1 CTCTCTTTCTCAGTCTGCAACATGCGGCTGTCTCGGGTGTGGCTGTCTGTTTGTCTGTGC 

( I | | | | I | | | | | | | | | | | | II I II I I I I I I I I t M I I I 1 I i I i I I I I I I M I 

4775 CTCTCTTTCTCAGTCTGC 

6 1 GCCGTGGTGCTGGGTCAGTGCCAGCGGGAGACCGCAGAAAAAAACGATTATTACCGAGTA 

I . < I . I 1 I 1 I I I I I I I I I i I t I 1 1 1 1 1 1 H I 1 1 i I I M I I I It 1 1 1 1 I I I I 1 I I I 1 1 1 1 I 

48 3 5 GCCGTGGTGCTGGGTC AGTGCC AGCGGGAGACCGC AGAAAAAAACGATTATTACCGAGTA 
121 CCGCATTACTGGGACGCGTGCTCTCGCGCGCTGCCTGACCAAACCCGTTACAAGTATGTG 

. I I i I M I I I I I I 1 | | | | | | M I I I I I I I II I I M I I I I I I I I I I I I I I I I I i M I I t I I 

48 9 5 CCGCATTACTGGG ACGCGTGCTCTCGCGCGCTGCCTGACC AAACCCGTTAC AAGTATGTG • 

181 GAACAGCTCGTGGACCTCACGTTGAACTACCACTACG 

, - ■ | . , | I | | | | | | | | | | | | | | | | | | | | | I I I I I I I I I II i I II I I I I M I II I I I 1. 1 M 
4955 gaIcagctcgtggacctcacgttgaactaccactacgatgcgagccacggcttggacaac 



241 tttgacgtgctcaagag • - 

5015 UUicG'l'GclciiGiGGTGAGGG'rACGCGCTAAAGGTGTATGACAACGGGAAGGTAAGG 

256 : : .' 

5075 GCGAACGGGTAACGGGTAGGTAACCGCATGGGGTGTGAAATGACGTTCGGAACCTGTGCT 

2 56 • aatcaACGTGACCGAGGTGTCGTTGCTCATCAGCGACTTTATACGTCAGAACCGT ' 

"' in him ii ii ii i hum i mi ill ii ii m ii iti '"'.mmiiimi 

5135 tGCAGAATCAACGTGACCGAGGTGTCGTTGCTCATCAGCGACTTTAGACGTCAGAACCGT 

313 CGCGGCGGCACCAACAAAAGGACGACGTTCAACGCCGCCGGTTCGCTGGCGCCTCACGCC 

Ml 1 ill I I III MII1MI I Mil I IM MM I II MM Ml MM 

5195 CGCGGCGGCACCAACAAAAGGACCACGTTCAACGCCGCCGGTTCGCTGGCGCCTCACGCC 

3 7 3 CGGAGCCTCGAGTTCAGCGTGCGGCTCTTTGCCAACTAGCCTGCGTCACGGGAAATAATA 

I | I | | | | | | | | I I I I II I II I I I 1 M I M II I M I M I I I Ml II M I I M » I II M II I 

5255 CGGAGCCTCGAGTTCAGCGTGCGGCTCTTTGCCAACTAGCCTGCGTCACGGGAAATAATA 

4 3 3 TGCTACGGCTTCTGCTTCGTCA'CCACTTTCACTGCCTGCTTCTGTGCGCGGTTTGGGC AA 

I I I I I M II II I I M II II I II II I I II I I MM II I I M I I M M Ml I M M I 

5315 TGCTACGGCTTCTGCTTCGTC 

49 3 CGCCCTGTCTGGCGTCTCCGTGGTTCACGCTAACGGCGAACC AGAATCCGTCCCCGCC AT 
I | | | Mil I I I I I I I I II II I I I M II II I M M I II I II I I II I I I I M I M I I I I I I I 
5375 CGCCCTGTCTGGCGTCTCCGTGGTTCACGCTAACGGCGAACC AGAATCCGTCCCCGCC AT 

5 5 3 GGTCTAAACTG ACGTATCCC AAACCGC ATGACGCGGCG ACGTTTTACTGTCCTTTTCTCT 

' ,||||t Mill! IIIJIIIIIIIIIIIIIIIIIIIIIIIIIMIIM 

54 3 5 GGTCTAAACTGACGTATCCC AAACCGC ATGACGCGGCGACGTTTTACTGTCCTTTTCTCT 
'613 ATCCCTCGCCCCCACGGTCCCCCTCGCAATTCCCGGGGTTCCAGCGGGTATCAACGGGTC 

I I I I 1 I II I II I II II M II I! II II I II I! M I I I I I II I M I II I I II II I M I I Ml 

5495 ATCCCTCGCCCCCACGGTCCCCCTCGCAATTCCCGGGGTTCCAGCGGGTATCAACGGGTC 
673 CCGAGTGTCGCAACGAGACCCTGTATCTGCTGTACAACCGGGAAGGCC AGACCTTGGTGG 

I i | | | |-| | i I I M II II 11 II M M II I M I I I I I I hi I I I I I I I MM 

5555 CCGAGTGTCGC AACG AG ACCCTGTATCTGCTGTAC AACCGGGAAGGCC AGACCTTGGTGG 
7 3 3 AGAGAAGCTCC ACCTGGGTG AAAAAGGTGATCTGGT ATCTG AGCGGTCGC AATC AGACCA 

I | I | I | | | | | | { | | | II M I II I M II II I I II I M II I M I II I I II M I I I I I 

5615 Igagaagctccacctgggtgaaaaaggtgatctggtatctgagcggtcgcaatcagacca 

793 tcctccaacggatgccccgaacggcttcgaaaccgagcgacggaaacgtgcagatcagcg 

i i i i i i ii ii I I I I || II I I II I M II II II II II I I II I M I I I II I II I II I I M II II 
5675 tcctccaacggatgccccgaacggcttcgaaaccgagcgacggaaacgtgcagatcagcg 

853 tggaagacgccaagatttttggagcgcacatggtgcccaagcagaccaagctgctacgtt 
\ i I I I I I I I II II II I I II I M II II M I II 11 II I I I I II I I I I I II I I I I I I II II I I 

5735 tggaagacgccaagatttttggagcgcacatggtgcccaagcagaccaagctgctacgct 

913 tcgtcgccaacgatggcacacgttatcagatgtgtgtgatgaaactggagagctgggccc. 

ii i || I I |l I || I ! I II II I II II I I I I I I I M I I M I I I II II II II II I 

5795 tcgtcgtcaacgatggcacgcgttatcagatgtgtgtgatgaagctggagagctgggccc 

973 acgtcttccgggactacagcgtgtcttttcaggtgcgattgacgttcaccgaggccaata - 

I i i i i i i i || || l l || || M I I 1 II I II I M II I II I II M I II I I I M I I I M I 

5855 Icgtcttccgggactacagcgtgtcttttcaggtgcgattgacgttcaccgaggccaata 

10 33 accagacttac accttctgc acccatccc aatctc atcgtttg agcccgtcgcgcgcgca 
I i M I I II I M II M II M M I II I I 1 I I I I I I M II I I I I I I M I I I II I M M I I M 
5915 Iccagacttacaccttctgtacccatcccaatctcatcgtttgagcccgtcgcgcgcgca 

1093 gggaattttgaaaaccgtgcgtcatgagtcccaaaaacctgacgccgttcttgacggcgt 
I I I I I I II I II II M I I II II I I M I M II M II M II I II I It I i II I I M II Ml 
5975 gggaattttgaaaaccgcgcgtcatgagtcccaaagacctgacgccgttcttgacgacgt 



1 I 53 TGTGGCTGCTATTGGGTCAC AGCCGCGTGCCGCGGGTACGCGCAGAAGAATGTTGCGAAT 

I | | | | I I I I I I I 1 I II I II I t I I I I I I I I I I I I I I I I I i I I I I Mil 

603 5 TGTGGCTGCTATTGGGTCAC AGCCGCGTGCCGCGGGTGCGCGCAGAAGAATGTTGCGAAT 

1213 TC ATAAACGTC AACC ACCCGCCGG AACGCTGTTACGATTTC AAAATGTGC AATCGCTTC A 

HIM II II M I Mill II MM Ml I M I I II Mill II Ml II 11.11 I Ml II MM I 

6 09 5 TC ATAAACGTC AACC ACCCGCCGG AACGCTGTTACGATTTC AAAATGTGC AATCGCTTCA 
127 3 CCGTCGCGTACGTATTTTCATGATTGTCTGCGTTCTGTGGTGCGTCTGGATCTGTCTCTC 

I I || || M I I I I M I I M II M I 1 1 I I II I 1 1 I M I I.I I II I I 11 I I 1 1 I M II I 11 i 

6155 CCGTCGCGTACGTATTTTTATGATTGTCTGCGTTCTGTGGTGCGTCTGGATTTGTCTCTC 

133 3 GACGTTTCTGATAGCC ATGTTCCATCG ACGATCCTCGGGAATGCCAG AGTAG ATTTTCAT 
| | || I II II I M I I I II I I I I II I II II I II I I I M M I M I I I I M I II I II II II I I I 
6 215 GACGTTTCTGATAGCC ATGTTCCATCGACGATCCTCGGGAATGCCAGAGTAGATTTTC AT 

139 3 G AATCCAC AGGCTGCGGTGTCCGGACGGCGAAGTCTGCTAC AGTCCCG AG AAAACGGCTG 

I II II II II II I M II II I II II I II II M II II II II I II 11 I II II II 1 1 II I II 1 1 I 

627 5 GAATCC AC AGGCTGCGGTGTCCGGACGGCGAAGTCTGCTAC AGTCCCG AGAAAACGGCTG 
14 53 AGATTCGCGGGATCGTCACCACCATGACCCATTCATTGACACGCCAGGTCGTACACAACA 

I I I II I M II II II II II II II I M II II I M II M M I II II II I M II II II II II M 

6 3 3 5 AG ATTCGCGGG ATCGTC ACCACCATGACCC ATTC ATTGAC ACGCCAGGTCGTAC AC AAC A 

1513 AACTGACG AACTGCAACTAC AATCC 

. | | M II I I I M I I I II II II I M I 

6 39 5 AACTGACGAGCTGCAACTACAATCCGTAAGTCTCTTCCTCGAGGGCCTTACAGCCTATGG 

1538 '. 

64 55 G AAAGTAAG ACAG AGGGACAAAACATC ATTAAAAAAAAAGTCTAATTTC ACGTTTTGTAC 
1538 GTTATACCTCGAAGCTGACGGGCG AATACGCTGCGG 

I M I II I I I I I M M I I I I I I I II II I I M I I M I I 

6 515 CCCCCCTTCCCCTCCGTGTTGTAGGTTATACCTCGAAGCTGACGGGCGAATACGCTGCGG 
1574 CAAAGTGAACGACAAGGCGCAGTACCTGCTGGGCGCCGCTGGCAGCGTTCCCTATCGATG. 

|| I Ml II II II I I II I I M II MM I II I Ml II I II M I I M I II I I II I I I II I'll I 

6 57 5 CAAAGTGAACGACAAGGCGC AGTACCTGCTGGGCGCCGCTGGCAGCGTTCCCTATCGATG 

1 6 34 GATCAACCTGGAATACGACAAGATAACCCGGATCGTGGGCCTGGATCAGTACCTGGAGAG 

I I I I M II M II I 1 1 1 II II I I II II II 1 1 II II II I I II II II II II II M II If I I II 

66 35 G ATC AACCTGGAATACGACAAGATAACCCGGATCGTGGGCCTGG ATCAGTACCTGG AG AG 

1694 CGTTAAG AAACAC AAACGGCTGGATGTGTGCCGCGCTA AAATGGGCTATATGCTGCAGTG 
| | || | | || || II I II I I I M II II I II I I II I I I II II I M II II II I I I II I I I'M M 
66 9 5 CGTTAAAAAACAC AAACGGCTGGATGTGTGCCGCGCTA AAATGGGCTATATGCTGCAGTG 

17 54 AATAATAAAATGTGTGTTTGTCCGCAAAAAAAAAAAAAAAAAAAAAAA 

II I I II I I I ! I I I I I 1 II I I I I II II I I I 

6 7 55 AATAATA AAATGTGTGTTTGTCCGAAATACGCGTTTTG AGATTTCTGT 



Translation of SEQKlon95-3.txt 



1 ATGCGGCTGTCTCGGGTGTGGCTGTCTGTTTGTCTGTGCGCCGTGGTGCTGGGTCAGTGC 

1 MRLS-RV'WLSVCLCAVVLGQC 

61 CAGCGGGAGACCGCAGAAAAAAACGATTATTACCGAGTACCGCATTACTGGGACGCGTGC 

21 QRET AEKg -DYYRVPHYWDAC 

121 TCTCGCGCGCTGCCTGACCAAACCCGTTACAAGTATGTGGAACAGCTCGTGGACCTC ACG 

41 SRALPDQTRYKYVEQLVDLT 

181 TTGAACTACCACTACGATGCGAGCCACGGCTTGGACAACTTTGACGTGCTCAAGAGAATC 

61 L| YHYDASHGLD§FDVL .K R I 

241 AACGTGACCGAGGTGTCGTTGCTCATCAGCGACTTTATACGTCAGAACCGTCGCGGCGGC 

81 £jVTEV,SLL ISD FIRQjJRRGG 

301 ACC AACAAAAGGACCACGTTCAACGCCGCCGGTTCGCTGGCGCCTCACGCCCGG AGCCTC 

101 T§KRTTF§AAGSL A P. HARSL 

3 61 GAGTTCAGCGTGCGGCTCTTTGCCAACTAG 

121 EFSVR-LFAg* 



Vergleich RACE clone 95-8 -FIX genomische Sequenz 

Obere Zeile: RACE Klone 95-8 
Untere Zeile: FIX genomic Sequenz 

1 CTCTCTTTCTCAGTCTGCAACATGCGGCTGTGTCGGGTGTGGCTGTCTGTTTGTCTGTGC 

I I I f 1 1 I I I I I I I I I I I i I I I II i I I I I I I I I M 1 1 I I I I I I I i 1 1 I I II 1 f ! I I I I 1 1 I 

4 7 7 5 CTCTCTTTCTCAGTCTGCAACATGCGGCTGTGTCGGGTGTGGCTGTC TGTTTGTCTGTGC 

6 1 GCCGTGGTGCTGGGTCAGTGCCAGCGGGAGACCGCAGAAAA AAACGATTATTACCGAGTA 

I I I I I I I I } I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I t I I I I I I I I I I I I I 
4 835 GCCGTGGTGCTGGGTCAGTGCCAGCGGGAGACCGCAGAAAA AAACGATTATTACCGAGTA 

1 2 i CCGC ATTACTGGG ACGCGTGCTCTCGCGCGCTGCCTGACC AAACCCGTTAC AAGTATGTG 

MM II MINIM MM Ml II I II Ml II M I II II ill I (III II I II Ml II I II I 

4 895 CCGC ATTACTGGG ACGCGTGCTCTCGCGCGCTGCCTGACCAAACCCGTTAC AAGTATGTG 
GAACAGCTCGTGGACCTCACGTTGAACTACCACTACGATGCGAGCCACGGCTTGGACAAC 

I M II I II II I II I I I I I I I I I I II II II I I II I I I I II I I II I I II M I I I I M M I I I • 

GAACAGCTCGTGGACCTCACGTTGAACTACCACTACGATGCGAGCCACGGCTTGGACAAC 
TTTGACGTGCTCAAGAGGTGAGGGTACGCGCTAAAGGTGTATGACAACGGGAAGGTAAGG ' • 

II II I I II II I 1 1 II II I I II I II II M I 1 1 1 1 I II II I I I II 1 1 II I I I II I I II M II 

TTTGACGTGCTCAAGAGGTGAGGGTACGCGCTAAAGGTGTATGACAACGGGAAGGTAAGG 
GCGAACGGGTAACGGGTAGGTAACCGCATGGGGTGTGAAATGACGTTCGGAACCTGTGCT 

I I I I I I I M I I I II I I I M I M I I II I I I I II II I II I M M I M I M I I I I M I I II I I 

GCGAACGGGTAACGGGTAGGTAACCGCATGGGGTGTGAAATGACGTTCGGAACCTGTGCT 
TGCAGAATCAACGTGACCGAGGTGTCGTTGCTCATCAGCGACTTTAGACGTCAGAACCGT 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I II I I I I I I I M I I 1 1 I I I I I I I I I I I I 

TGCAGAATCAACGTGACCGAGGTGTCGTTGCTCATCAGCGACTTTAGACGTCAGAACCGT 

CGCGGCGGCACCAACAAAAGGACCACGTTCAACGCCGCCGGTTCGCTGGCGCCTCACGCC 
I J I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 

CGCGGCGGCACCAACAAAAGGACCACGTTCAACGCCGCCGGTTCGCTGGCGCCTCACGCC / 
CGGAGCCTCGAGTTCAGCGTGCGGCTCTTTGCCAACTAGCCTGCGTCACGGGAAATAATA 

II II II II I I I M II I M II I II II M I II II I II I I II I I I I 1 1 I 1 1 I II 1 1 II I II 1 1 

CGGAGCCTCGAGTTCAGCGTGCGGCTCTTTGCCAACTAGCCTGCGTCACGGGAAATAATA 

TGCTACGGCTTCTGCTTCGTCACCACTTTCACTGCCTGCTTCTGTGCGCGGTTTGGGCAA 
I II I I I I II I I I I I I II I I I II I II I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I 
TGCTACGGCTTCTGCTTCGTCACCACTTTCACTGCCTGCTTCTGTGCGCGGTTTGGGCAA 

CGCCCTGTCTGGCGTCTCCGTGGTTCACGCTAACGGCGAACCAGAATCCGTCCCCGCCAT 
I I I I I I I I I I I I I I I I I I I I II I (' I I I II I II I I II I I II I I I I I I I I I I I I I I I II i I I 

CGCCCTGTCTGGCGTCTCCGTGGTTCACGCTAACGGCGAACCAGAATCCGTCCCCGCCAT 

GGTCTAAACTGACGTATCCCAAACCGCATGACGCGGCGACGTTTTACTGTCCTTTTCTCT 

I f I M I I I I I I I I I I I I I II I E I I I I I I 1 1 I I I I I 1 1 I I I I i I I I 1 1 I I I 1 1 I I I I I I I I 

GGTCTAAACTGACGTATCCCAAACCGCATGACGCGGCGACGTTTTACTGTCCTTTTCTCT 

ATCCCTCGCCCCCACGGTCCCCCTCGCAATTCCCGGGGTTCCAGCGGGTATCAACGGGTC 
I I I I I I I I I II II II I I I I I II I I II I I I I I I I I I I I M M I I I I I I I I I I II II I II I I 
ATCCCTCGCCCCCACGGTCCCCCTCGCAATTCGCGGGGTTCCAGCGGGTATCAACGGGTC 

CCGAGTGTCGCAACGAGACCCTGTATCTGCTGTACAACCGGGAAGGCCAGACCTTGGTGG 
I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CCGAGTGTCGCAACGAGACCCTGTATCTGCTGTACAACCGGGAAGGCCAGACCTTGGTGG 

AGAGAAGCTCCACCTGGGTGAAAAAGGTGATCTGGTATCTGAGCGGTCGCAATCAGACCA 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AGAGAAGCTCCACCTGGGTGAAAAAGGTGATCTGGTATCTGAGCGGTCGCAATC AGACCA 

TCCTCCAACGGATGCCCCGAACGGCTTCGAAACCGAGCGACGGAAACGTGCAGATCAGCG 

II I M III II II II II I I M II III II MM M I II I M II I M I 1 1 I M II II I II II I 

TCCTQCAACGGATGCCCCGAACGGCTTCGAAACCGAGCGACGGAAACGTGCAGATCAGCG 
TGGAAGACGCCAAGATTTTTGGAGCGCACATGGTGCCCAAGCAGACCAAGCTGCTACGTT 

I II I I I I II I I I II I I M I I I I I I I I I I II I I M I M I M I I II II I I I I II I I I I I I I 

57 35 TGGAAGACGCCAAGATTTTTGGAGCGCACATGGTGCCCAAGCAGACCAAGCTGCTACGCT 

1021 TCGTCGTCAACGATGGCACACGTTATCAGATGTGTGTGATGAAACTGGAGAGCTGGGCCC 
I I I I { I I I I I I I I I I I I I i I I I I II I I I ! I I I I I I I I II I I I I I I I I I I I I I II I I I I 

579 5 TCGTCGTCAACGATGGCACGCGTTATCAGATGTGTGTGATGAAGCTGGAGAGCTGGGCCC 

1081 ACGTCTTCCGGGACTACAGCGTGTCTTTTCAGGTGCGATTGACGTTCACCGAGGCCGATA 
I I I I I I I I I I I I I I I I I I I M I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II Ml 

58 55 ACGTCTTCCGGGACTACAGCGTGTCTTTTCAGGTGCGATTGACGTTCACCGAGGCCAATA 

1141 ACCAGACTTACACCTTCTGCACCCATCCCAATCTCATCGTTTGAGCCCGTCGCGCGCGCA 

I I I I I I II I I I I I I I r J I I I I I I II I I I II M I II I I I I I I I M I I I I I I M I I I I I I I 
5915 ACCAGACTTACACCTTCTGTACCCATCCCAATCTCATCGTTTGAGCCCGTCGCGCGCGCA 

1201 GGGAATTTTGAAAACCGCGCGTCATGAGTCCCAAAAACCTGACGCCGTTCTTGACGGCGT 

II I I I I II I I I I I I I I I I I I II ) I I I I I I II 1.1 I I I I I I I I I I I I I I I I I I 1 I I I Ml 



5975 GGGAATTTTGAAAACCGCGCGTCATGAGTCCCAAAGACCTGACGCCGTTCTTGACGACGT 
1261 TGTGGCTGCTATTGGGTC AC AGCCGCGTGCCGCGGGTACGCGC AGAAG AATGTTGCGAAT 

I I I I I t I I I I I I I I I I I I I'M Ml I I M I II I I M I I I I II M I I I M I I I I I I I I I I I 

6 035 TGTGGCTGCTATTGGGTC AC AGCCGCGTGCCGCGGGTGCGCGCAGAAGAATGTTGCGAAT 



1321 TCATAAACGTCAACCACCCGCCGGAACGCTGTTACGATTTCAAAATGTGCAATCGCTTCA 

I M II I I I II I i Ml I I I I I I I I I M II I M II I I M I I I I I II I I I I I M I I I II I II I 

609 5 TCATAAACGTCAACCACCCGCCGGAACGCTGTTACGATTTCAAAATGTGCAATCGCTTCA 

1381 CCGTCGCGTACGTATTTTCATGATTGTCTGCGTTCTGTGGTGCGTCTGGATCTGTCTCTC 
I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I II I II I I II I I I I I I I I I I I I I I If I 
6155 CCGTCGCGTACGTATTTTTATGATTGTCTGCGTTCTGTGGTGCGTCTGGATTTCTCTCTC 

14 41 GACGTTTCTGATAGCC ATGTTCCATCGACGATCCTCGGGAATGCCAGAGTAGATTTTCAT 
I I Ml M I I I II I M II M M M I II M I I' I I II I M I I I I M I I I M I I M II I I I I II 
6 215 GACGTTTCTGATAGCCATGTTCCATCGACGATCCTCGGCAATGCCAGAGTAGATTTTCAT 

1501 GAATCCACAGGCTGCGGTGTCCGGACGGCGAAGTCTGCTAC AGTCCCGAGAAAACGGCTG 

I I M M I I I II I II II I I II II I II II I I I I II I I I I I I I I I I 1 1 I I I M M M I I I M i 

627 5 GAATCC AC AGGCTGCGGTGTCCGGACGGCGAAGTCTGCTAC AGTCCCGAGAAAACGGCTG 
1561 AGATTCGCGGGATCGTCACCACCATGACCCATTCATTGACACGCCAGGTCGTACACAACA ■ 

I 1 1 I 1 I I II If II II II 1 1 I M I M I II II II I 11 I II I I I M I II I I II II II I II I I I 

63 35 AGATTCGCGGGATCGTCACCACCATGACCCATTC ATTGACACGCCAGGTCGTACACAACA 
16 2.1 AACTGACGAGCTGCAACTACAATCC * 

I I I I II I I I II M II II I'll II I I I . 
6 395 AACTGACGAGCTGCAACTACAATCCGTAAGTCTCTTCCTCG AGGGCCTTAC AGCCTATGG 

1646' 



6 4 55 GAAAGTAAGACAGAGGGAC AAAACATCATTAAAAAAAAAGTCTAATTTCACGTTTTGTAC 

1646 GTTATACCTCGAAGCTG ACGGGCG AATACGCTGCGG 

I I II M I M II I I I I I I I II I I I I I I I II I I II I I I 
6 515 CCCCCCTTCCCCTCCGTGTTGTAGGTTATACCTCGAAGCTGACGGGCGAATACGCTGCGG 

1682 CAAAGTGAACGACAAGGCGCAGTACCTGCTGGGCGCCGCTGGCGGCGTTCCCTATCGATG 

II II II II I II II I II I I I I I I I II II I I I I I II II I II II M II I II I I I I II I I I I I 

6 575 CAAAGTGAACGACAAGGCGC AGTACCTGCTGGGCGCCGCTGGCAGCGTTCCCTATCGATG 

•174 2 GATCAACCTGGAATACGACAAGATAGCCCGGATCGTGGGCCTGGATCAGTACCTGGAGAG 
I I II I I II I I I II II I 1 I I II II I I II I II I I I I I II I I I II II II I II I I I I I M I I I 
6 6 35 GATCAACCTGGAATACGACAAGATAACCCGGATCGTGGGCCTGG ATC AGTACCTGGAGAG 

1802 ' CGTTAAGAAACACAAACGGCTGGATGTGTGCCGCGCTAAAATGGGCTATATGCTGCAGTG . 
I I I I II I I I I II II I II I I I I I I I I I I II II I I II I I II I II I I II M I I I I II II II I 

6695 CGTTAAAAAACACAAACGGCTGGATGTGTGCCGCGCTAAAATGGGCTATATGCTGCAGTG 

186 2 AATAATAAAATGTGTGTTTGTCCAAAAAAAAAAAAAAAAAAAAAAAA 

II I I M II II I II M II II M I I II I I I I 

.6755 AATAATAAAATGTGTGTTTGTCCGAAATACGCGTTTTGAGATTTCTG 



Translation of SEQKlon95-8.txt 



1 • ATGCGGCTGTGTCGGGTGTGGCTGTCTGTTTGTCTGTGCGCCGTGGTGCTGGGTCAGTGC 
1 MRL- CRV WLSV'CL CAVVLGQC 

61 CAGCGGGAGACCGCAGAAAAAAACGATTATTACCGAGTACCGCATTACTGGGACGCGTGC 
21 QR «ETAE K§. D Y YRVPHYWDAC 

121 TCTCGCGCGCTGCCTGACCAAACCCGTT ACAAGTATGTGGAACAGCTCGTGGACCTCACG 
41 SRALPD ,Q T R - Y K Y V- E Q L' V D L T 

181 TTGAACTACCACTACGATGCGAGCCACGGCTTGGACAACTTTGACGTGCTCA AGAGGTGA 
61 L§YHYDASHGLD§jFDVL KR + 




Abb. Mr 



Vergleich RACE clone 128 -FIX genomische Sequenz 

Obere Zeile: FIX genomische Sequenz 
Untere Zeile: RACE Klon 128 

ATGAGTCCCAAAGACCTGACGCCGTTCTTGACGACGTTGTGGCTGCTATTGGGTCACAGC 
I I I I I I I I I I I I I I f I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 

ATGAGTCCCAAAAACCTGACGCCGTTCTTGACGGCGTTGTGGCTGCTATTGGGTCACAGC . 

CGCGTGCCGCGGGTGCGCGCAGAAGAATGTTGCGAATTCATAAACGTCAACCACCCGCCG 
I I I I I I I I I I I I I I II I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CGCGTGCCGCGGGTACGCGCAGAAGAATGTTGCGAATTCATAAACGTCAACCACCCGCCG 

6118 GAACGCTGTTACGATTTCAA AATGTGC AATCGCTTC ACCGTCGCGTACGTATTTTTATGA 

I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I MM 
121 GAACGCTGTTACGATTTC AAAATGTGC AATCGCTTC ACCGTCGCGTACGTATTTTCATG A 

6178 TTGTCTGCGTTCTGTGGTGCGTCTGGATTTGTCTCTCGACGTTTCTGATAGCCATGTTCC 

1 1 1 ii i m ii ii 1 1 1 1 1 ii 1 1 1 1 1 1 1 1 1 1 1 ii 1 1 ii ii 1 1 1 1 1 ii 1 1 1 i 1 1 1 1 1 1 1 1 1 1 

1 8 3 TTGTCTGCGTTCTGTGGTGCGTCTGGATCTGTCTCTCGACGTTTCTGATAGCCATGTTCC 
ATCGACGATCCTCGGGAATGCCAGAGTAGATTTTCATGAATCCACAGGCTGCGGTGTCCG 

I I j 1 1 1 [ 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 m 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

ATCGACGATCCTCGGGAATGCCAGAGTAGATTTTCATGAATCCACAGGCTGCGGTGTCCG 



GACGGCGAAGTCTGCTACAGTCCCGAGAAAACGGCTGAGATTCGCGGGATCGTCACCACC 
I I I I I I I I II M I I M I I I I II I I I I 1 I I II I I II II I I I I I I I I I I I I I II I I I I I I I I 
GACGGCGAAGTCTGCTACAGTCCCGAGAAAACGGCTGAGATTCGCGGGATCGTCACCACC 

/ 

6 3 58' ATGACCCATTCATTGACACGCCAGGTCGTACACAACAAACTGACGAGCTGCAACTACAAT 

M II I I I M I I I M I I I I M M I I I I I I I I 11 I 1 I M I I I I I I II I I I II I I I I I Ml II 

3 61 ATGACCC ATTC ATTGACACGCCAGGTCGTAC AC AAC AAACTGACGAGCTGCAACTACAAT 

6 418 CCGTAAGTCTCTTCCTCGAGGGCCTTACAGCCTATGGGAAAGTAAGACAGAGGGACAAAA 

II" 

All cc : 

64 78 CATCATTAAAAAAAAAGTCTAATTTCACGTTTTGTACCCCCCCTTCCCCTCCGTGTTGTA 



5998 
1 

6058 
61 



6238 




241 
6298 



301 



6538 GGTTATACCTCGAAGCTGACGGGCGAATACGCTGCGGCAAAGTGAACG ACAAGGCGCAGT 
I I I I I I I I 11 I I I I I M I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I 1 I II I I I I I 
4 23 . GTTATACCTCGAAGCTGACGGGCGAATACGCTGCGGCAAAGTGAACGACAAGGCGCAGT 

6 598 ACCTGCTGGGCGCCGCTGGCAGCGTTCCCTATCGATGGATCAACCTGGAATACGACAAGA 

I I M I I I II M I I I I II I I I I I I I I I I II I II I II II I I I I I I II I I I I II I I I II I I I 

4 82 ACCTGCTGGGCGCCGCTGGCGGCGTTCCCTATCGATGGATC AACCTGGAATACGACAAGA 

66 58 TAACCCGGATCGTGGGCCTGGATCAGTACCTGGAGAGCGTTAAAAAAC ACAAACGGCTGG 

II II II I I III I II I I I II I I I I II I I I I II M M I I I I I I I 1 II I I I I II I I I I I I I 
542 TAGCCCGGATCGTGGGCCTGGATCAGTACCTGGAGAGCGTTAAGAAAC ACAAACGGCTGG 

ATGTGTGCCGCGCTAAAATGGGCTATATGCTGCAGTGAATAATAAAATGTGTGTTTGTCC 
I I I I I M I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I i I 
ATGTGTGCCGCGCTAAAATGGGCTATATGCTGCAGTGAATAATAAAATGTGTGTTTGTCC 

G AAATAC GCGTTTTG AG ATTTCTG 

Mil II 

A A AAAAA AAA AAAA AAAAA AAAAA . 



6718 
602 
6778 



662 



Translation of SEQ128.txt 



1 ATGAGTCCCAAAAACCTGACGCCGTTCTTGACGGCGTTGTGGCTGCTATTGGGTCACAGC 
1 MS PKNLTPFLTALWLLLGHS 

61 CGCGTGCCGCGGGTACGCGCAGAAGAATGTTGCGAATTCATAAACGTCAACCACCCGCCG 
21 RVPRVRAEECCE FlgVgH PP 

121 GAACGCTGTTACGATTTCAAAATGTGCAATCGCTTCACCGTCGCGTACGTATTTTCATGA 

41 ercydfkmcSrftva y vf s * ' 



I 



Vergleich RACE Klon 95-11 - FIX genomische Sequenz 
Obere Zeile: FIX genomische Sequenz 
Untere Zeile: RACE Klon 95-11 



4 796 ATGCGGCTGTGTCGGGTGTGGCTGTCTGTTTGTCTGTGCGCCGTGGTGCTGGGTCAGTGC 

I I I I I I I M I I I I I I I I I I I I I I I I I I 1 i I I I I I I I III i I I I I I I I I I I I I I I I I I I H 

1 ATGCGGCTGTGTCGGGTGTGGCTGTCTGTTTGTC TGTGCGCCGTGGTGCTGGGTCAGTGC 

4856 CAGCGGGAGACCGCAG . . AAAAAAACGATTATTACCGAGTACCGCATTACTGGGACGCGT 
I I ! I I I I I I I I I I I I I I I f II I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I t I I I II I I 
6 1 CAGCGGGAGACCGCAGggAAAAAAACG ATTATTACCGAGTACCGCATTACTGGGACGCGT 

4 914 GCTCTCGCGCGCTGCCTGACCAAACCCGTTACAAGTATGTGGAACAGCTCGTGGACCTCA 
I I I I I I I I I I I I I II I I I I I I I I I III III I I I I I I I I f I I I I I I I I I 1 II i I I I I I I I I 
121 ■ GCTCTCGCGCGCTGCCTGACCAAACCCGTTACAAGTATGTGGAACAGCTCGTGGACCTCA 

4 974 CGTTGAACTACCACTACGATGCGAGCCACGGCTTGGACAACTTTGACGTGCTCAAGAGGT 

I | | I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II 
181 CGTTGAACTACCACTACGATGCGAGCCACGGCTTGGACAACTTTGACGTGCTCAAGAG . . 

50 34 GAGGGTACGCGCTAAAGGTGTATGAC AACGGGAAGGTAAGGGCGAACGGGTAACGGGTAG 



5094 GTAACCGCATGGGGTGTGAAATGACGTTCGGAACCTGTGCTTGCAGAATCAACGTGACCG 

I I I I I I I I I I I I I I 

237 ' AATC AACGTGACCG 

5154 AGGTGTCGTTGCTCATCAGCGACTTTAGACGTCAGAACCGTGGCGGCGGCACCAACAAAA 
I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I.I I I I I I I I I I I I I I I I I I I I I I I I I I 
253 AGGTGTCGTTGCTCATCAGCGACTTTAGACGTCAGAACCGTCGCGGCGGCACCAACAAAA 

5214 GGACCACGTTCAACGCCGCCGGTTCGCTGGCGCCTCACGCCCGGAGCCTCGAGTTCAGCG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
313 GGACCACGTTCAACGCCGCCGGTTCGCTGGCGCCTCACGCCCGGAGCCTCGAGTTCAGCG 

5274 TGCGGCTCTTTGCCAACTAGCCTGCGTC ACGGG AAATAATATGCTACGGCTTCTGCTTCG 
I I I | | I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
373 TGCGGCTCTTTGCCAACTAGCCTGCGTC ACGGG A A AT AAT A TGCTACGGCTTCTGCTTCG 

5334 TCACCACTTTCACTGCCTGCTTCTGTGCGCGGTTTGGGCAACGCCCTGTCTGGCGTCTCC 
v I I I I I I 1 I I I I I I I I I I I I II I I I I I I I I I I N I I I I I I I I I I I I I I I I I I I I I I I 'I I I I 
4 3 3- TCACCACTTTCACTGCCTGCTTCTGTGCGCGGTTTGGGCAACGCCCTGTCTGGCGTCTCC 

5394 GTGGTTCACGCTAACGGCGAACCAGAATCCGTCCCCGCCATGGTCTAAACTGACGTATCC 

1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I M Tl I I 1 1 I I I I I I I I 

493 GTGGTTC ACGCTAACGGCGAACCAGAATCCGTCCCCGCCATGGTCTAAACTGACGTATCC 

54 54 CAAACCGCATGACGCGGCGACGTTTTACTGTCCTTTTCTCTATCCCTCGCCCCCACGGTC 
I I I I I I I I I I I I I I I I I t I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I II 
553 CAAACCGCATGACGCGGCGACGTTTTACTGTCCTTTTCTCTATCCCTCGCCCCCACGGTC 

• 5514 CCCCTCGCAATTCCCGGGGTTCCAGCGGGTATC AACGGGTCCCGAGTGTCGCAACGAG AC 
) ^ I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

/J^k , 613 CCCCTCGCAATTCCCGGGGTTCCAGCGGGTATTAACGGGTCCCGAGTGTCGCAACGAGAC 

5574 - CCTGTATCTGCTGTACAACCGGGAAGGCCAGACCTTGGTGGAGAGAAGCTCCACCTGGGT 

' I I I I I I I j I I I I I I I I I I I I I I I I I I I i I'l I I I I I M I I I I I I I I I I I I I I I 1 I I I I I I I 

67 3 CCTGTATCTGCTGTAC AACCGGGAAGGCCAGACCTTGGTGG AG AGAAGCTCCACCTGGGT 

5634 GAAAAAGGTGATCTGGTATCTGAGCGGTCGCAATCAGACCATCCTCCAACGGATGCCCCG 
I I I I I I I I I I I I I I I I. I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
7 3 3 GAAAAAGGTGATCTGGCATCTGAGCGGTCGCAATCAGACCATCCTCCAACGGATGCCCCG 

5694 AACGGCTTCGAAACCGAGCGACGGAAACGTGCAGATCAGCGTGGAAGACGCCAAGATTTT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I J I I I I I I I I I I I I I II I i II I I I I 
79 3 AACGGCTTCGAAACCGAGCGACGGAAACGTGCAGATCAGCGTGGAAGACGCCAAGATTTT 

5754 TGGAGCGCACATGGTGCCCAAGCAGACCAAGCTGCTACGCTTCGTCGTCAACGATGGCAC 
' i I I I I I I I I I I I I I I I I I I I I I I I I I I l-l I I I I I I I I 11 I I I I I I I I I I I 1 I I I I I I I 
853 TGGAGCGCACATGGTGCCC AAGCAGACC AAGCTGCTACGTTTCGTCGCCAACG ATGGC AC 

5814 GCGTTATCAGATGTGTGTGATGAAGCTGGAGAGCTGGGCCCACGTCTTCCGGGACTACAG 
I I I I I I I I.I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
9 L 3 " ACGTTATTAGATGTGTGTGATGAAACTGGAGAGCTGGGCCC ACGTCTTCCGGGACTACAG 

5874 CGTGTCTTTTCAGGTGCGATTGACGTTCACCGAGGCCAATAACCAGACTTACACCTTCTG 

I I I I I I I I I I I I I I.I I I I I I I ) I I I t I I I I I I I I I I I i I I I I 1 I I I I I I I I I I I I I I I I I - 
97 3 CGTGTCTTTTCAGGTGCGATTGACGTTCACCGAGGCCAATAACCAGACTTACACCTTCTG 

5934 TACCCATCCCAATCTCATCGTTTGAGCCCGTCGCGCGCGCAGGGAATTTTGAAAACCGCG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I LI I I I I I I I I I I I I I I I 
1033 C ACCCATCCCAATCTCATCGTTTGAGCCCGTCGCGCGCGCAGGGAATTTTGAAAACCGCG 



5994 CGTCATGAGTCCCAAAGACCTGACGCCGTTCTTGACGACGTTGTGGCTGCTATTGGGTCA 
I'l I I I II I 11 I I I I I I i I I I I I I I I 1 I I II I I I I I I I I I I I I i I I ! I I i I I I I I i If I 
109 3 CGTC ATGAGTCCC AAAA ACC TG ACGCCGTTCTTG ACGGCGTTGTGGCTGCTATTGGGTCA 

60 54 CAGCCGCGTGCCGCGGGTGCGCGCAGAAGAATGTTGCGAATTCATAAACGTCAACCACCC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I t I II I I I I I I I I I I I I I I I I I I I I I 
1153 • CAGCCGCGTGCCGCGGGTACGCGCAGAAGAATGTTGCGAATTCATAAACGTCAACCACCC 

6114 GCCGGAACGCTGTTACGATTTC AAAATGTGCAATCGCTTC ACCGTCGCGTACGTATTTTT 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 1 I I I I I I I I I I I ■ 
1213 GCCGGAACGCTGTTACGATTTC AAAATGTGCAATCGCTTCACCGTCGC 

6174 ATGATTGTC TGCGTTCTGTGGTGCGTCTGGATTTGTCTCTCGACGTTTCTGATAGCCATG 

1262 

• 6234 TTCC ATCG ACGATCCTCGGG AATGCC AGAGTAGATTTTC ATGAATCC AC AGGCTGCGGTG 

I I I I I I I I I 

1262 . . GCTGCGGTG 

6294 TCCGGACGGCGAAGTCTGCTACAGTCCCGAGAAAACGGCTG AGATTCGCGGGATCGTCAC 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ii 1 1 1 1 1 1 1 1 1 m 1 1 1 1 n 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 

1270 TCCGGACGGCGAAGTCTGCTACAGTCCCGAGAAAACGGCTG AGATTCGCGGGATCGTCAC 
6354 C ACC ATG ACCCATTCATTGAC ACGCC AGGTCGTAC ACAACAAACTGACGAGCTGCAACTA 

I I I I I I I I I I I I I I I I II I I I I I I I i I I I I I I I I I I I I II I I I I I I I I I I I M I I I I I I I 

1330 CACC ATG ACCCATTCATTGAC ACGCC AGGTCGTAC ACAACAAACTGACGAGCTGC AACTA 

6414 C AATCCGTAAGTCTCTTCCTCGAGGGCCTTACAGCCTATGGGAAAGTAAGACAG AGGGAC 
I F I I I I * 

1390 CAATCC 

64 74 ''.AAACATCATTAAAAAAAAAGTCTAATTTCACGTTTTGTACCCCCCCTTCCCCTCCGTGT 

1396 

6534 TGTAGGTTATACCTCGAAGCTGACGGGCGAATACGCTGCGGCAAAGTGAACGACAAGGCG 
I I I I I.I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1396 GTTATACCTCGAAGCTGACGGGCGAATACGCTGCGGC AAAGTG AAdGAC AAGGCG 

6 594 CAGTACCTGCTGGGCGCCGCTGGCAGCGTTCCCTATCGATGGATCAACCTGGAATACGAC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I II I II I I I I I I 
14 51 CAGTACCTGCTGGGCGCCGCTGGCAGCGTTCCCTATCGATGGATCAACCTGGAATACGAC 

6654 AAGATAACCCGGATCGTGGGCCTGGATC AGTACCTGGAGAGCGTTAAAAAACAC AAACGG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I III I I I I I I I I 
1511 AAGATAACCCGGATCGTGGGCCTGGATCAGTACCTGGAGAGCGTTAAGAAATAC AAACGG 

6714 CTGGATGTGTGCCGCGCTAAAATGGGCTATATGCTGCAGTGAATAATAAAATGTGTGTTT 
I I I I 1.1 I III I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I i I I I I I I I I I I I I I I I II I I 
157 I CTGG ATGTGTGCCGCGCTAAAATGGGCTATATGCTGC AGTG AATAATA AAATGTGTGTTT 

67 74 GTCCGAAATACGCGTTTTGAGATTTCTGTCGCCGACTAAATTCATGTCGCGCGATAGTGG 

I I I I I I I I II I II I I I I I I 

16 31 GTCCAAAAAAAAAAAAAAAAAAAAAAAAAAGTACTCTGCGTTGTTACCACTGCTTGCCCT 

68 34 TGTTTATCGCCGATA 

I. I I I * 

1691 ATAGTGAGTCGTATT . 



Translation of SEQKlon95-ll.txt 



1 ATGCGGCTGTGTCGGGTGTGGCTGTCTGTTTGTCTGTGCGCCGTGGTGCTGGGTCAGTGC 

1 MRLCRVWLSVCLCAVVLGQC 

61 cagcgggagaccgcagaaaaaaaEScgattattaccgagtaccgcattactgggacgcgt 

21 qretaekktiiteyr-itgtr 

121 gctctcgcgcgctgcctgaccaaacccgttacaagtatgtggaacagctcgtggacctca 

41 ala'rcltkpvtsmw'ns swts 



181 
61 



CGTTGA 
R * 



